NEW
快讯列表

关于 Kimi k1.5 的快讯列表

时间 详情
2025-02-03
15:42
强化学习提升DeepSeek-R1和Kimi k1.5等模型的推理能力

据DeepLearning.AI称,强化学习(RL)正被越来越多地用于提升DeepSeek-R1和Kimi k1.5等模型的推理能力。这些模型利用RL完善其推理步骤,在数学和编程等复杂领域提供更精确的解决方案。这一发展可能通过提高计算准确性和效率来影响算法交易策略(来源:DeepLearning.AI)。

来源